home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / icon / newsgrp / group98b.txt / 000026_icon-group-sender _Thu May 14 12:24:44 1998.msg < prev    next >
Internet Message Format  |  2000-09-20  |  2KB

  1. Return-Path: <icon-group-sender>
  2. Received: from kingfisher.CS.Arizona.EDU (kingfisher.CS.Arizona.EDU [192.12.69.239])
  3.     by baskerville.CS.Arizona.EDU (8.8.8/8.8.7) with SMTP id MAA12478
  4.     for <icon-group-addresses@baskerville.CS.Arizona.EDU>; Thu, 14 May 1998 12:24:34 -0700 (MST)
  5. Received: by kingfisher.CS.Arizona.EDU (5.65v4.0/1.1.8.2/08Nov94-0446PM)
  6.     id AA22110; Thu, 14 May 1998 12:24:30 -0700
  7. Message-Id: <199805141509.RAA25422@capway.com>
  8. From: "Vladimir Grodzenski" <grodzens@capway.com>
  9. To: icon-group@optima.CS.Arizona.EDU
  10. Date: Thu, 14 May 1998 17:05:33 +0000
  11. Mime-Version: 1.0
  12. Content-Type: text/plain; charset=US-ASCII
  13. Content-Transfer-Encoding: 7BIT
  14. Subject: Re: AI use for Icon
  15. Reply-To: <vladimir.grodzenski@capway.com>
  16. Priority: urgent
  17. In-Reply-To: <199805061704.MAA14525@axp.cmpu.net>
  18. Errors-To: icon-group-errors@optima.CS.Arizona.EDU
  19. Status: RO
  20. Content-Length: 1140
  21.  
  22. On  6 May 98 at 12:04, Gordon Peterson wrote:
  23.  
  24. > For the "fuzzy match" I think that one interesting way to at least
  25. > help winnow down the possibilities would be to examine the
  26. > intersection of the character sets of the different names.  Those
  27. > which have a high intersection (all but a "few" characters) can be
  28. > then examined more closely.
  29. > For a better "fuzzy compare" function I've liked the use of
  30. > overlapping character pairs (including a blank added to the start
  31. > and end of each name).
  32.  
  33. Another approach:  
  34.  
  35. for each employee 'name' create a table, the keys of which
  36. will be the characters from 'name' and values - their occurence in
  37. 'name'.   Such as:
  38.  
  39.  T := table(0)  
  40.  every T [!name] +:= 1
  41.  
  42. We can define "sort of a difference" between two tables (T1,T2):
  43.  
  44. procedure tdiff(T1, T2)
  45. local T, weight
  46.  weight := 0
  47.  T := table(0)
  48.  
  49.  every k := key(T1) | key(T2) do
  50.      T [k] := abs( T1[k] - T2[k] )
  51.  
  52.  every weight +:= !T
  53.  return weight
  54. end
  55.  
  56.  
  57. Vladimir Grodzenski
  58. =================================================
  59. E-mail: vladimir.grodzenski@capway.com
  60. CompuServe: 100700,526
  61. =================================================
  62.